rank | frequency | n-gram |
---|---|---|
1 | 14153 | -ն |
2 | 8690 | -ի |
3 | 8235 | -։ |
4 | 6721 | -ը |
5 | 3643 | -՝ |
rank | frequency | n-gram |
---|---|---|
1 | 4679 | -ան |
2 | 3869 | -ին |
3 | 3150 | -ւմ |
4 | 2657 | -րի |
5 | 2113 | -ը։ |
rank | frequency | n-gram |
---|---|---|
1 | 3101 | -ում |
2 | 2192 | -երի |
3 | 1736 | -երը |
4 | 1359 | -կան |
5 | 1340 | -յան |
rank | frequency | n-gram |
---|---|---|
1 | 1752 | -ների |
2 | 1390 | -ները |
3 | 1298 | -ական |
4 | 1017 | -թյան |
5 | 966 | -ելու |
rank | frequency | n-gram |
---|---|---|
1 | 1010 | -ւթյան |
2 | 628 | -թյուն |
3 | 600 | -յունը |
4 | 587 | -ներին |
5 | 506 | -ներից |
The tables show the most frequent letter-N-grams at the ending of words for N=1…5. Everything runs in parallel to 2.2.5 Most frequent word beginnings. The aim is suffix detection instead of affix detection.
For N=3:
SELECT @pos:=(@pos+1), xx.* from (SELECT @pos:=0) r, (select count(*) as cnt ,concat("-", right(word,3)) FROM words WHERE w_id>100 group by right(word,3) order by cnt desc) xx limit 5;
2.2.5 Most frequent word beginnings